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LE 论 专家 发 展 了 一 系列 基 汪 


并 不 能 如 同 描述 性 理论 
统考 察 了 个 体 在 为 所 有 


理论 , 以 期 捕获 所 有 人 的 风险 决策 行为 。 然 而 大 
那样 理想 地 描述 单一 个 体 的 决 


4) 
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FHRA ae A 14 (expectation-maximization) J 


F 据 表明 , 这 些 基 于 期 望 值 最 大 化 的 理论 


了 为 。 本 研究 采用 眼 动 追踪 技术 , 系 


人 决策 与 为 自己 决策 时 的 风险 决策 行为 及 信息 加 工 过 程 的 差异 。 本 


能 很 好 捕获 个 体 为 自己 


证 参考 。 
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进行 单 次 决策 时 的 情况 。 本 看 
的 理论 与 启发 式 / 非 基 于 期 望 值 最 大 化 的 理 


相传 有 一 个 关于 决策 到 
和 决策 分 析 领 域 的 莫 基 人 。1957 4 
学 的 教 职 邀 请 。Raiffa 犹豫 不 决 , 便 向 哥 伦 比 3 


议 Raiffa 应 根据 他 自己 


研究 发 现 , 基于 期 望 值 最 大 化 的 理论 可 捕获 为 所 有 人 决策 或 为 自己 多 次 决策 时 的 情况 , 却 不 


究 结 果 有 助 于 理解 基于 期 望 值 最 大 化 


论 的 边界 , 为 风险 决策 理论 的 划分 和 发 展 提供 实 


Hie AX Howard Raiffa 的 轶 事 。Raiffa 是 贝 叶 斯 决策 理论 的 先驱 
E, 时 任教 于 哥伦比亚 大 学 的 Raiffa 教授 收 到 了 来 自 哈佛 大 
大 学 的 系 主任 寻求 建议 。 讽 刺 的 是 , 系 主任 建 
,所 提出 的 决策 分 析 理 论 那 样 进行 决策 : 分 析 两 个 选项 的 相关 维度 , 赋 


决策 差异 , 眼 动 追踪 技术 


予 各 维度 以 权重 , 再 根据 期 望 值 算法 计算 出 两 选项 的 总 分 , 并 选择 总 分 更 高 的 学 校 。 然 而 ， 


Raiffa 却 回答 说 :“ 不 , 这 是 一 个 严肃 的 抉择 (No, this is a serious decision). "(I Bazerman et al., 
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1998)。 这 则 轶 事 提示 我 们 , 为 描述 所 有 人 的 决策 行为 所 发 展 出 的 决策 理论 不 一 定 适用 于 


述 单一 个 体 的 决策 。 主 


因 。 


流 的 决策 理论 专家 试图 为 所 有 面临 决策 的 个 体 提供 普 适 性 的 最 优 决 
策 方案 , 并 发 展 出 了 丰富 多 样 的 “加 权 求 和 最 大 化 ”的 决策 理论 。 然 而 , 当 在 现实 世界 中 面临 


真实 的 决策 问题 时 , 决策 者 (甚至 包括 决策 理论 专家 本 人 ) 并 不 愿 将 这 些 复杂 的 加 权 求 和 理论 
十 诸 实 践 。 受 到 Raiffa 轶 事 的 启发 , 本 研究 旨 在 探索 导致 期 望 值 最 大 化 的 理论 失效 的 内 在 原 


在 风险 决策 领域 , 基于 期 望 值 最 大 化 (expectation-maximizatiom) 理 论 的 发 展 史 , 便 可 视 为 
Raiffa 轶 事 的 演绎 史 。 主 流 的 风险 决策 理论 从 未 放弃 期 望 值 最 大 化 的 核心 框架 , 即 假设 在 风 
险 决 策 中 , 个 体会 基于 概率 的 权重 函数 对 各 选项 结果 的 效用 进行 加 权 , 并 累加 所 有 加 权 后 的 


效用 值 ( 即 获取 期 望 值 ), 最 终 选 择期 望 值 最 大 的 选项 Kahneman & Tversky, 1979; Payne & 


Braunstein, 1978; Tversky & Kahneman, 1992)。 期 望 价值 (expected value, EV) 理 论 (Bernoulli， 


1738)、 期 望 效用 (expected utility, EU) 理 论 (von Neumann & Morgenstern, 1947)、 预 期 理论 


(prospect theory) (Kahneman & Tversky, 1979) 等 均 属于 此 类 理 


Te, 这 些 理论 均 假 设 风险 决策 是 


基于 加 权 求 和 的 加 工 过 程 做 出 的 (Payne & Braunstein, 1978)。 


然而 , 大 量 证 据 表 明 主 流 理论 家 发 展 的 基于 期 望 值 最 大 化 的 理论 并 不 能 捕获 个 体 (甚至 


j 基 于 期 望 值 最 大 化 的 理论 所 假设 的 认 知 加 工 过 程 , 而 是 采 / 


如 Raiffa 一 样 的 决策 专家 ) 的 真实 风险 决策 行为 。 众 多 研究 表明 , 个 体 在 风险 决策 时 并 未 采 


] 基 于 男 一 类 独特 理论 取向 的 简 


单 启 发 式 策略 进行 决策 (Brandstiitter et al., 2006; Li, 2004, 2016)。 这 些 启发 式 理论 假设 , 个 体 


在 风险 决策 时 不 必 整 合 选 项 所 有 维度 的 信息 以 达成 决策 。 许 多 启发 式 理论 , 如 最 大 值 最 大 启 


发 式 (maximax heuristic, MH) (Savage, 1951)、 齐 当 别 (equate-to-differentiate, ETD) 抉 择 模型 (Li， 


2004, 2016; Huang et al., 2021)、 占 优 启 发 式 (priority heuristic) 


假设 个 体 在 风险 决策 时 首先 会 识别 并 比较 选项 间 多 个 维度 (或 单一 维度 ) 的 差异 , 并 基于 关键 


的 单一 维度 进行 决策 。 


(Brandstitter et al., 2006) 等 , 均 


主流 决策 理论 家 之 所 以 不 放弃 遵循 加 权 求 和 计算 方式 的 基于 期 望 值 最 大 化 的 理论 , 或 是 
理论 能 够 准确 、 理 想 地 捕获 到 人 们 的 风险 决策 行为 。 在 发 展 基 于 期 


因为 他 们 从 不 怀疑 这 些 
H 


望 值 最 大 化 的 各 种 理论 时 , 理论 家 往往 试图 发 展 出 用 于 计算 最 优 决策 方案 的 数理 模型 , 使 得 
本 (Baron, 1986)。 在 本 研究 中 , 我 们 聚焦 于 这 种 为 所 有 


该 方案 适用 于 所 有 面临 这 一 方案 的 个 


人 决策 (decision-for-everyone) 的 情况 , 即 为 所 有 面临 该 选择 的 人 提供 最 优 方案 。 此 外 , 本 研究 
亦 关 注 多 次 决策 (decision-for-self-multiple-play), 即 当 风 险 选 项 会 被 执行 多 次 时 , 个 体 的 风险 


决策 行为 (Li, 2003; Su et al., 2013)。 本 研究 认为 , 与 单 次 为 自 
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己 决 策 (decision-for-self-single- 


play) 的 情况 不 同 , 基于 期 望 值 最 大 化 的 理论 或 许 在 描述 为 所 有 人 决策 或 多 次 决策 时 是 行 得 通 


的 。 


我 们 认为 , 基于 期 望 值 最 大 化 的 理论 可 以 解释 为 所 有 人 决策 和 多 次 决策 的 情况 。 与 多 次 
风险 决策 类 似 , 在 为 所 有 人 决策 的 情境 中 , 个 体 需 要 为 所 有 面临 选择 的 人 提供 最 优 方案 , 即 意 
味 着 所 选择 方案 将 被 执行 多 次 。 根 据 大 数 定律 (law of large numbers), 即 在 大 样本 中 , 随机 事 
件 发 生 的 相对 频数 可 近似 于 事件 发 生 的 概率 (van der Stoep & Seifert, 1994), 因此 如 果 某 一 风 
险 决策 的 重复 次 数 足够 多 , 那么 其 决策 结果 会 趋 近 于 期 望 价值 (Klos et al., 2005)。 由 于 在 为 所 


有 人 决策 和 多 次 决策 的 情况 下 , 风险 决策 一 旦 做 出 便 会 被 执行 多 次 , 因此 决策 者 倾向 于 将 风 


险 选 项 的 可 能 结果 视 为 可 相互 补偿 的 , 并 考虑 选项 的 过 去 统计 数据 和 未 来 的 多 种 机 会 , 从 而 


遵循 期 望 值 最 大 化 理论 所 假设 的 决策 策略 。 相 反 , 单 次 为 自己 决策 的 情境 无 法 满足 基于 期 望 
值 最 大 化 的 理论 重复 多 次 的 理论 需求 。 因 此 , 决策 者 往往 倾向 于 将 风险 选项 视 为 独特 的 


(Kahneman & Lovallo, 1993), 并 认为 不 同 选项 的 可 能 结果 不 可 互相 补偿 (DeKay et al., 2006; 


DeKay & Kim, 2005), 从 而 “明智 地 ”忽略 其 期 望 值 (Kahneman & Lovallo, 1993)。 在 这 种 情况 


F, 个 体 并 不 会 采用 期 望 策略 ( 即 基 于 期 望 值 最 大 化 的 策略 ), 而 更 可 能 采用 一 些 启发 式 策略 


(Brandstatter et al., 2006; Li, 2004, 2016). 


现 有 的 行为 学 和 认 知 神经 科学 研究 一 致 发 现 , EV 策略 已 经 可 以 较 好 描述 个 体 的 多 次 风 
险 决 策 情 境 (Klos et al., 2005; Li, 2003; Rao et al., 2013; Su et al., 2013), 这 在 一 定 程 度 上 支持 了 


本 研究 的 推断 (参见 孙 红 月 等 , 2011)。 然 而 , 尽管 人 们 意识 到 相对 于 日 常生 活 中 为 自己 决策 ， 


制定 标准 的 治疗 方案 等 ) 其 决策 质量 问题 更 事 关 


大 、 其 决策 后 果 所 产生 的 影 


为 所 有 人 决策 (如 政府 为 所 有 公民 制定 应 对 重大 公共 卫生 突 发 事件 的 政策 、 医 生 为 所 有 病人 
重 


响 力 


更 加 深远 ， 


但 至 今 尚 鲜 有 研究 检验 期 望 策略 ( 即 基于 期 望 值 最 大 化 的 策略 ) 是 否 可 足够 好 地 描述 为 所 有 
人 做 风险 决策 的 情境 。 此 外 , 缺乏 为 所 有 人 决策 与 为 自己 决策 的 差异 的 了 解 也 阻碍 我 们 理解 


现实 中 一 些 决策 冲突 发 生 的 潜在 机 理 。 


= 


医疗 决策 为 例 , 医生 为 众多 患者 决策 时 或 采用 期 望 


策略 以 降低 “决策 噪声 ”(Kahneman, et al., 2021), 而 为 自己 或 家 人 进行 医疗 决策 时 可 能 采取 茶 


IR 


启发 式 策略 (Popovic, et al., 2019), 这 种 由 于 不 同 决策 目标 、 情 境 所 产生 的 决策 差异 或 可 导 


致 医 患 关系 冲突 问题 。 因 此 , 考察 为 所 有 人 决策 的 特点 与 心理 机 制 不 仅 具 有 理论 意义 而 且 具 


有 重要 的 现实 应 用 价值 。 


EL 不 


本 研究 采用 组 内 设计 , 检验 了 个 体 在 为 所 有 人 决策 情境 和 多 次 决策 情境 中 


AE 


采用 与 为 


自己 决策 情境 中 相同 的 决策 策略 。 本 研究 假设 , 个 体 在 为 所 有 人 决策 和 多 次 决策 条 件 下 更 可 
能 采用 期 望 策略 , 而 在 为 自己 单 次 决策 条 件 下 更 可 能 采用 局 发 式 策略 。 近 年 来 , 眼 动 追踪 技 
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术 被 成 功用 于 考察 决策 的 认 知 加 工 过 程 (Brandstitter & Körner, 2014; Liu et al., 2021; Liu et al., 


2020; Sui et al., 2020; Zhou et al., 2021; 魏 子 蛤 , XH, 2015)。 因 此 , 本 研究 采用 眼 动 追踪 技 
术 来 比较 个 体 在 不 同 决策 任务 中 的 信息 加 工 过 程 , 以 检验 研究 假设 。 

本 研究 构建 了 三 个 风险 决策 任务 : 为 所 有 人 决策 任务 , 多 次 决策 任务 和 单 次 (为 自己 ) 决 
策 任务 。 引 入 多 次 决策 任务 , 是 因为 鉴于 众多 研究 已 经 验证 个 体 在 多 次 决策 任务 中 倾向 于 采 
期 望 策略 (Klos et al., 2005; Langer & Weber, 2001; Li, 2003; Sun et al., 2013), 这 一 任务 可 用 
芷 对 照 任 务 以 帮助 鉴别 为 所 有 人 决策 任务 和 单 次 决策 任务 中 个 体 是 否 也 采用 了 期 望 策 略 。 

期 望 策略 与 启发 式 / 非 期 望 策略 对 个 体 的 眼 动 指标 有 不 同 的 预测 。 总 的 来 说 , 采用 这 两 
种 不 同 策略 会 影响 个 体 的 整体 扫 视 轨迹 模式 (Zhou et al., 2016)。 有 具体 来 说 , 采用 这 两 种 策略 
会 从 三 方面 影响 个 体 的 信息 搜索 与 加 工 : 信息 加 工 的 深度 、 复 杂 度 和 方向 (Su et al., 2013). 
采用 期 望 策略 通常 需要 整合 选项 的 所 有 可 用 信息 , 采取 复杂 的 计算 方法 , 进行 基于 选项 的 信 
息 搜索 ; 而 采用 启发 式 / 非 期 望 策略 通常 只 需要 有 选择 性 地 使 用 选项 信息 , 采取 简单 的 定性 比 
Be, 进行 基于 维度 的 信息 搜索 。 因 此 , 如 果 为 所 有 人 决策 任务 和 多 次 决策 任务 基于 期 望 策略 ， 
而 单 次 决策 任务 基于 启发 式 / 非 期 望 策略 , 那么 为 所 有 人 决策 任务 和 多 次 决策 任务 与 单 次 决 
策 任务 在 眼 动 指标 上 将 存在 差异 。 据 此 , 本 研究 提出 如 下 假设 : 

Hi: 为 所 有 人 决策 任务 和 多 次 决策 任务 的 扫 视 轨迹 模式 的 相似 性 应 高 于 为 所 有 人 决策 任 
务 和 单 次 决策 任务 的 相似 性 。 

Ho: 为 所 有 人 决策 任务 和 多 次 决策 任务 的 信息 获取 深度 和 信息 加 工 复杂 度 应 高 于 单 次 决 
策 任务 , 且 比 单 次 决策 任务 更 多 采用 基于 选项 的 信息 搜索 模式 。 

为 明确 相关 眼 动 指标 在 实验 任务 与 风险 决策 之 间 的 解释 作用 , 本 研究 进一步 检验 如 下 假 


Hs: 眼 动 指标 ( 即 信息 获取 深度 , 信息 加 工 复杂 度 和 信息 搜索 方向 ) 可 中 介 决 策 任务 对 个 


体 的 选择 是 否 符合 EV 预测 (EV-consistent choice) 的 效应 。 
为 进一步 检验 个 体 是 否 采用 期 望 策略 或 启发 式 / 非 期 望 策略 , 研究 者 通常 会 基于 认 知 心 


理学 中 常用 的 双 分 离 (double dissociatiom) 逻 辑 操纵 两 个 影响 因素 (Brandstitter et al., 2006; Rao 


et al., 2013; 刘 洪 志 等 , 2015; 张 阳 阳 等 , 2018)。 双 分 离 逻 辑 指 的 是 : 如 果 某 因素 影响 任务 A 的 
绩效 但 不 影响 任务 B, 另 一 因素 影响 任务 B 的 绩效 但 不 影响 任务 A, 则 表明 两 任务 包含 不 同 
的 心理 过 程 (Rao et al., 2013)。 本 研究 关注 的 第 一 个 因素 是 两 选项 期 望 值 的 差异 。 有 研究 发 
现 , 两 选项 EV 差异 越 大 , 基于 期 望 值 最 大 化 的 理论 预测 的 准确 率 越 高 (Brandstaitter et al., 2006, 


2008)。 本 研究 关注 的 第 2 个 因素 是 维度 差异 。 有 研究 发 现 , 结果 维度 的 差异 可 影响 启发 式 / 
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非 期 望 策略 的 选择 行为 和 认 知 加 工 过 程 (Brandstiitter et al., 2006; Rao et al., 2013; Rao et al., 
2011; Huang et al., 2021)。 因 此 , 本 研究 也 检验 了 如 下 假设 。 

结果 维度 差异 的 量 级 (简称 结果 差异 ) 应 当 影 响 单 次 决策 任务 的 信息 加 工 过 程 (如 信息 
获取 深度 ), 而 选项 间 EV 值 差异 的 量 级 (简称 EV 差异 ) 不 会 有 此 效应 ; EV 差异 应 当 影 响 为 所 
有 人 决策 任务 和 多 次 决策 任务 的 信息 加 工 过 程 (如 信息 加 工 复 杂 度 ), 而 结果 差异 不 会 有 此 效 


WY g 
2 方法 


2.1 被 试 


采用 G*Power 软件 (version 3.1.9.2) (Faul et al., 2007) 计 算 实验 所 需 样本 量 。 设 定 统计 检 
验 力 (1 — B)73 95%, SUM Cohen’s f= 0.32 (参考 Su 等 人 (2013) 的 研究 结果 ), 计算 所 需 样本 
HA Y = 46。 实 验 共 招募 52 名 大 学 生 被 试 (男性 26 A, 平均 年 龄 = 22.8 土 3.0 周岁 )。 所 有 被 
试 视力 或 矫正 视力 正常 , 且 实验 前 签署 了 知情 同意 书 。 实 验 结束 后 被 试 获 得 120 元 人 民 币 的 
基本 报酬 及 0-45 元 与 实验 表现 相关 的 额外 奖励 。4 名 被 试 的 数据 因 眼 动 追踪 数据 不 完整 被 
删除 , 有 效 被 试 48 人 。 


2.2 设备 


被 试 的 眼 动 数据 通过 采样 率 为 1000 Hz 的 Eye-Link 1000 眼 动 仪 (SR Research, Canada) 
收集 。 被 试用 双眼 观看 实验 刺激 , 但 只 采集 右 眼 的 眼 动 数 据 。 实 验 刺激 呈现 于 19 英寸 的 
CRT 显示 器 上 (刷新 率 为 150 Hz), 其 分 辩 率 为 1024 x 768。 为 减 小 头 动 对 眼 动 轨迹 的 影响 , SE 
验 中 采用 距离 显示 器 60 cm 的 腮 托 固定 被 试 的 头 部 。 被 试 双眼 与 屏幕 边缘 的 水 平视 角 为 37"， 
垂直 视角 为 28"。 被 试 通过 用 一 个 微软 SideWinder 手柄 按键 来 对 实验 刺激 做 出 反应 。 


2.3 实验 材料 和 程序 


2.3.1 实验 刺激 


本 研究 建构 了 108 对 各 包含 两 个 金钱 结果 的 风险 选项 ( 见 补充 材料 表 ST: 
https://osf.io/yg67b/), 所 有 选项 只 涉及 金钱 获 益 。108 对 选项 组 成 3 (EV 差异 : 小 , 中 , A) x 3 
(结果 差异 : 小 , 中 , 大 ) 的 实验 设计 , 每 种 条 件 包含 12 对 选项 。EV 差异 指 的 是 两 选项 之 间 EV 
值 的 差异 , 分 为 3 个 水 平 : 两 选项 的 EV 差异 为 10, 30 和 60。 每 个 选项 包含 一 个 最 好 可 能 结 


果 和 一 个 最 差 可 能 结果 。 两 选项 在 最 好 可 能 结果 维度 的 差异 分 为 3 个 水 平 : 差异 为 400, 300 
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和 200; 两 选项 在 最 差 可 能 结果 维度 的 差异 固定 为 100. 


实验 采用 Brandstütter 和 Körner (2014) 的 刺激 呈现 方式 , 以 保证 被 试 每 次 只 能 单独 注视 
选项 的 某 一 信息 , 而 无 法 有 效 感 知 到 相 邻 信息 。 有 具体 来 说 , 每 个 信息 (结果 或 概率 ) 均 被 一 个 边 
长 为 3.50° 视 角 、 厚 度 为 0.90° 视 角 的 正方 形 所 包围 , 以 防止 被 试 的 余 光 识 别 到 其 他 相 邻 信息 
(Bouma, 1970)。 任 意 相 邻 两 信息 的 中 心 距离 为 5.95° 视 角 , 可 保证 被 试 在 不 发 生 眼 动 的 情况 
下 只 能 识别 一 个 条 目 (Rayner, 2009)。 每 个 选项 的 结果 信息 均 呈 现在 其 对 应 概率 的 左 侧 (如 图 


la 所 示 )。 选 项 的 呈现 位 置 已 平衡 , 即 EV 值 较 大 的 选项 一 半 在 上 侧 一 半 在 下 侧 。 


2.3.2 实验 任务 
本 研究 构建 了 三 个 风险 决策 任务 : 为 所 有 人 决策 任务 , 多 次 决策 任务 和 单 次 决策 任务 。 
pe 在 为 所 有 人 决策 任务 中 , 告知 被 试 从 两 选项 中 选 出 最 优选 项 , 假设 其 所 选择 的 选项 将 成 为 所 
有 面临 该 选择 的 人 的 选择 一 一 即 , 每 人 都 接受 相同 选择 , 但 可 能 面临 不 同 结 果 。 在 多 次 决策 


c 任务 中 , 告知 被 试 选择 自己 偏爱 的 选项 , 假设 其 选择 的 选项 将 被 执行 100 次 。 在 单 次 决策 任 


NL 务 中 , 告知 被 试 选择 自己 偏爱 的 选项 , 假设 其 选择 的 选项 只 被 执行 1 次 。 
O 为 进一步 激励 被 试 认真 完成 实验 任务 , 告知 被 试 他 们 的 额外 实验 报酬 将 由 其 在 实验 中 的 
表现 所 决定 。 在 多 次 决策 任务 和 单 次 决策 任务 中 , 告知 被 试 在 实验 结束 后 会 随机 选择 一 次 决 
SR, 用 一 个 后 台 程 序 来 确定 结果 , 并 按照 一 定 比 例 确定 实验 报酬 。 在 单 次 决策 任务 中 , 所 选择 
选项 将 被 执行 1 次 。 在 多 次 决策 任务 中 , 所 选择 选项 将 被 执行 100 次 , 即 被 试 的 某 一 次 选择 
将 被 后 台 程 序 执行 100 次 , 并 将 结果 累加 在 一 个 虚拟 账户 中 , 其 金额 越 大 , 被 试 在 此 任务 中 的 
奖励 越 多 。 在 为 所 有 人 决策 任务 中 , 告知 被 试 实验 结束 后 会 根据 他 们 是 否 为 所 有 人 选择 了 最 
优选 项 来 确定 其 实验 报酬 (并 未 要 求 被 试 选择 EV 值 大 的 选项 )。 在 实验 开始 前 , 告知 被 试 所 
有 实验 报酬 需 在 3 个 任务 全 部 完成 后 才 可 发 放 。 

实验 采用 被 试 内 设计 ,每 名 被 试 需 完成 全 部 3 个 实验 任务 , 但 被 试 每 次 来 实验 室 只 完成 1 
个 任务 , 任意 2 个 实验 任务 的 时 间 间 隔 不 少 于 3 天 。 任 务 顺 序 在 被 试 间 进行 了 平衡 。 三 个 任 
务 所 采用 的 实验 刺激 在 视觉 上 完全 相同 ( 见 图 1a)。 


2.3.3 实验 程序 


在 每 个 实验 任务 开始 前 先进 行 校准 。 实 验 采 用 9 点 校准 和 验证 , 最 大 验证 误差 为 0.5° 视 
角 。 在 初始 校准 后 进行 4 个 练习 试 次 , 以 帮助 被 试 熟悉 实验 刺激 的 呈现 方式 及 任务 要 求 。 正 


式 实验 包括 108 试 次 , 呈现 顺序 在 被 试 间 进行 了 平衡 。108 试 次 分 为 3 个 组 块 (block), 每 个 组 
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TRA 36 试 次 。 被 试 在 完成 每 个 组 块 后 可 休息 1-2 分 钟 。 


在 每 一 试 次 开始 时 , 屏幕 中 央 会 呈现 一 个 圆 形 注视 点 作为 漂移 校准 。 当 被 试 注 视屏 幕 中 
央 的 注视 点 时 , 可 通过 按键 来 触发 呈现 选项 刺激 。 然 后 被 试 通过 男 外 两 个 按键 进行 选择 , 按 


左 键 来 选择 屏幕 上 侧 的 选项 A, 按 右 键 来 选择 屏幕 下 侧 的 选项 B。 被 试 的 决策 上 
一 旦 做 出 决策 后 , 选项 刺激 将 消失 ,并 呈现 1000 ms 的 空白 屏 , 随后 开始 下 一 试 次 ( 详 见 图 


在 实验 过 程 中 不 会 出 现 关 于 选择 结果 的 任何 反馈 。 


a 


注视 点 
(漂移 校准 


— 


按键 反应 


空白 屏 (1000 ms) 


D 


2.4 模型 预测 


1 实验 刺激 及 流程 。(a) 实验 刺激 呈现 方式 。(b) 试 次 程序 及 时 间 。 


E TRI AP SE BR f], 
)。 


ja 


基于 被 试 的 选择 计算 不 同 决策 理论 预测 的 准确 率 。 本 研究 采用 的 理论 模型 包括 : (1) 3 


个 基于 期 望 值 最 大 化 的 理论 , 包括 EV 理论 (Bernoulli, 1738), EU 理论 (von Neumann & 


Morgenstern, 1947) 和 累积 预期 理论 (cumulative prospect theory, CPT) (Tversky & Kahneman, 


1992), 以 及 (2) 3 个 启发 式 / 非 基 于 期 望 值 最 大 化 的 到 


Lit, 包括 齐 当 别 抉择 模型 (Li, 2004, 2016), 


最 大 值 最 大 启发 式 (Brandstitter et al., 2006; Savage, 1951) 和 计数 启发 式 (tallying heuristic, TH) 


(Gigerenzer, 2004)。 以 上 模型 的 决策 


预测 力 。 


表 1 6 个 预测 模型 的 决策 规则 总 结 


模型 
Expected value (EV) FARE pi 
theory 和 选项。 


决策 规则 


规则 总 结 见 表 1。 本 研究 检验 了 以 上 模型 对 被 试 选择 的 


xi 计算 所 有 可 能 结果 的 加 权 值 的 总 和 , 并 选择 加 权 求 和 总 值 最 高 


u( 节 计算 加 权 结 果 的 总 和 , 并 选择 加 权 求 和 总 值 最 高 的 选项 。 本 


theory 


究 采 用 对 数 效用 函数 : u(xi) = log(xi) (Su et al., 2013). 


基 
的 
Expected utility (EU) 基于 公式 Ep’ 
i 
基 
页 


TAXE mpi) : vx) 计算 加 权 结果 的 总 和 , 并 选择 加 权 求 和 总 值 最 高 的 选 


Cumulative prospect 。 其 中 ap) = přip? + (0 — pi"), v) =xa。 本 研究 采用 正确 率 最 大 化 的 方 
theory (CPT) 法 在 个 体 水 平 估计 参数 值 , 即 对 于 每 一 个 体 , 估计 出 CPT 模型 对 该 个 体 预测 正 
确 率 最 高 的 一 组 参数 值 。 
Equate-to-differentiate 根据 在 维度 内 效用 差异 最 大 的 维度 (最 好 可 能 结果 维度 或 最 差 可 能 结果 维度 ) 进 
quate^o-ciderenüale — 行 决策 ,选择 在 此 维度 上 获 益 更 大 的 选项 。 本 研究 采用 对 数 效 用 函数 的 形式 : 
(ETD) model 
u(xi) = log(xi) (Su et al., 2013). 
al 选择 在 最 好 可 能 结果 维度 上 获 益 更 大 的 选项 。 


选项 满足 以 下 条 件 则 计数 : (a) 在 最 差 结 果 维 度 获 益 较 高 ， 


Tallying heuristic (TH) — 益 较 高 , (c) 最 差 结 果 对 应 的 概率 较 低 , (d) 最 好 结果 对 应 的 概率 较 高 。 最 终 选 择 


计数 标记 较 高 的 选项 。 


2.5 眼 动 数据 分 析 


(b) 在 最 好 结果 维度 获 


眼 动 数据 采用 软件 Eyelink Data Viewer (SR Research, Canada) 来 分 析 。 注 视点 (fixatiom) 
定义 为 两 次 眼 跳 之 间 眼 睛 位 置 相对 稳定 的 一 段 时 间 , 短 于 50 ms 的 注视 点 在 数据 分 析 时 被 易 


除 。 将 实验 刺激 划 为 8 SAAS 
ROIs)。 为 了 检验 研究 假设 , AR 


的 等 大 (5.90? x 5.90° 视 角 ) 和 矩形 兴趣 区 


X (regions of interest, 


完 分 析 了 扫 视 路 径 模式 , 各 兴趣 区 的 注视 次 数 , 不 同 兴 趣 区 


之 间 的 眼 跳 次 数 , 以 及 所 有 兴趣 区 的 平均 注视 时 长 。 同 时 , 为 检验 被 试 


程度 是 否 相同 , 本 研究 计算 了 每 个 试 次 的 最 大 瞳孔 直径 , 因为 


FLAS 


Ta 


验 任务 中 认真 程度 的 有 效 指标 (Hopstaken et al., 2015). 


3 结果 


在 三 个 任务 中 的 认真 
可 作为 反映 个 体 在 实 


实验 总 计 15552 试 次 , 其 中 2 试 次 因 眼 动 追踪 失败 而 在 数据 分 析 时 被 剔除 


以 试 次 中 的 最 大 瞳孔 直径 为 因 
现 , 实验 任务 的 主 效应 不 显著 , FO, 


变量 , 以 实验 任务 为 自 变量 的 单 因素 


94) = 2.20, p = 0.116, n? = 0.05, 表明 


重复 测量 方差 分 析 发 
被 试 在 三 个 任务 中 的 
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认真 程度 并 无 显著 差异 。 
3.1 行为 结果 
3.1.1 模型 预测 


以 模型 预测 准确 率 为 因 变量 , 做 3 (任务 ) x 6 (模型 ) 的 重复 测量 ANOVA. RRI , 任 


务 的 主 效应 显著 , F(2, 94) = 31.30, p < 0.001, n? = 0.40; 模型 的 主 效应 显著 , F(5, 235) = 


201.50, p < 0.001, nê% = 0.81; 交互 作用 显著 , F(10, 470) = 31.20, p < 0.001, 525 = 0.40。 事 后 检 


验 发 现 , 对 于 为 所 有 人 决策 任务 和 多 次 决策 任务 , EV、EU 和 CPT 的 预测 准确 率 显著 高 于 其 


他 模型 (ts = 9.07, ps < 0.001); 对 于 单 次 决策 任务 , EV. EU. TH. EDT 和 MH 的 预测 准确 率 


均 无 显著 差异 (ts < 2.56, ps > 0.502), 而 CPT 的 预测 准确 率 显 著 高 于 其 他 模型 (ks > 5.57, ps < 


iz 


0.001), 见 图 2. 


e ”期 望 理论 o ” 非 期 望 理论 


图 2 在 (a) 为 所 有 人 决策 任务 , (b) 多 次 决策 任务 和 (c) 单 次 决策 任务 三 个 任务 中 基于 期 望 值 最 大 化 的 理论 


与 启发 式 / 非 基 于 期 望 值 最 大 化 的 理论 对 选择 的 预测 准确 率 。 误 差 棒 表示 均值 的 标准 误 。 


3.1.2 决策 时 间 


决策 时 间 (ms) 进 行 了 自然 对 数 转换 。 单 因素 重复 测量 的 方差 分 析 表 明 , 决策 任务 的 主 效 


应 显著 , F(2, 94) = 5.39, p = 0.006, np = 0.10。 事 后 检验 发 现 , 单 次 决策 任务 的 决策 时 间 (M = 


8.75, 95% CI = [8.63, 8.87]) 短 于 为 所 有 人 决策 任务 (M= 8.91, 95% CI = [8.79, 9.03], to4 = 2.83, 


p=0.015) 和 多 次 决策 任务 (M = 8.91, 95% Cl = [8.78, 9.04], to4 = 2.86, p = 0.014), 但 为 所 有 人 


决策 任务 和 多 次 决策 任务 的 决策 时 间 没 有 显著 差异 (to4 = 0.02, p = 1.000). 


模型 预测 结果 表明 , 基于 期 望 值 最 大 化 的 理论 与 启发 式 / 非 基 于 期 望 值 最 大 化 的 理论 在 


单 次 决策 任务 中 的 预测 力 均 表现 不 够 好 。 基 于 期 望 值 最 大 化 的 理论 (尤其 是 EV 和 EU 理论 ) 


在 为 所 有 人 决策 任务 和 多 次 决策 任务 中 的 预测 力 优 于 启发 式 理论 (事实 上 , 启发 式 理论 并 未 


宣称 可 预测 人 们 在 为 所 有 人 决策 任务 和 多 次 决策 任务 中 的 选择 )。 这 些 结果 表明 , 相 比 于 单 


次 决策 任务 , 被 试 在 为 所 有 人 决策 任务 和 多 次 决策 任务 中 更 可 能 采用 EV 或 EU 理论 所 假设 


的 策略 。 由 于 期 望 策 略 通常 比 启 发 式 / 非 期 望 策略 需要 更 长 的 决策 时 间 (Rao et al., 2011; Su et 


al., 2013), 本 研究 关于 决策 时 间 的 结果 亦 表明 相 比 于 单 次 决策 任务 , 被 试 在 为 所 有 人 决策 任 


务 和 多 次 决策 任务 中 更 可 能 采用 期 望 策略 。 此 外 , 本 研究 所 发 现 的 单 次 决策 任务 与 多 次 决策 


任务 模型 预测 与 决策 时 间 上 的 差异 , 亦 重复 了 Su 等 人 (2013) 研 究 中 所 揭示 的 结果 模式 。 


32 扫 视 路 径 分 析 


为 了 检验 为 所 有 人 决策 任务 和 多 次 决策 任务 中 的 扫 视 路 径 模 式 是 否 异 于 单 次 决策 任务 


(Hi), 本 研究 采用 Zhou 等 人 (2016) 介 绍 的 扫 视 路 径 分 析 法 (scanpath analysis)。 当 个 体 在 某 一 


认 知 阶段 时 观看 屏幕 , 即 可 产生 一 个 相对 固定 的 “路 径 ”(pathb)。 这 一 路 径 往往 具有 特定 模式 ， 


Is 


此 称 为 “ 扫 视 路 径 ”(scanpath, Noton & Stark, 1971)。 扫 视 路 径 分 析 可 为 行为 决策 理论 的 认 


知 加 工 过 程 提供 更 清晰 、 直 接 的 证 据 (Ashby et al., 2016)。 通 常 使 用 相似 性 分 数 来 比较 风险 


决策 中 两 个 扫 视 路 径 的 相似 性 程度 (Zhou et al., 2016), 相似 性 分 数值 越 大 , 意味 着 两 个 扫 视 路 


径 越 相似 。 本 研究 采用 基于 Needleman-Wunsch(N-W)$:7X(Needleman & Christian, 1970) 的 


ScanMatch 软件 包 (Cristino et al., 2010), 来 计算 不 同 扫 视 路 径 之 间 的 相似 性 分 数 , 设置 参数 为 


Cristino 等 (2010) 建 议 的 默认 值 。 与 只 考虑 注视 点 序列 的 传统 字符 编辑 (string-editing) 算 法 相 


比 , N-W 算法 可 进一步 考虑 注视 序列 中 的 注视 点 时 长 , 将 注视 点 基于 时 长 进行 分 割 , 从 而 提 


3 


注视 序列 相似 性 比较 的 灵敏 度 , 此 外 , 这 一 算法 亦 可 基于 刺激 的 兴趣 区 进行 编码 (Zhou et 
10 


al, 2016)。 本 研究 分 别 计算 了 每 个 被 试 的 任务 内 和 任务 间 相 似 性 分 数 。 


单 次 决策 任务 的 任务 内 相似 性 分 数 (M = 0.465, 95% CI = [0.454, 0.476]) 显 著 低 于 为 所 有 


人 决策 任务 (M = 0.485, 95% CI = [0.468, 0.502], t47 = 2.66, p = 0.011, Cohen's d = 0.38) 和 多 次 


决策 任务 (M = 0.484, 95% CI = [0.470, 0.498], t47 = 3.35, p = 0.002, Cohen's d = 0.48) 的 相似 性 


分 数 , 而 后 两 者 没有 显著 差异 , t47 = 0.09, p = 0.933, Cohen's d= 0.01, LA 


U 


。 该 结果 表明 , 单 


次 决策 任务 的 扫 视 路 径 模式 的 内 部 一 致 性 低 于 为 所 有 人 决策 任务 和 多 次 决策 任务 , 这 上 暗示 相 


比 于 单 次 决策 任务 , 为 所 有 人 决策 和 多 次 决策 任务 的 扫 视 路 径 同 质 性 更 高 , 其 决策 策略 更 一 


致 。 


对 于 三 个 决策 任务 , 任务 内 相似 性 分 数 均 高 于 任务 间 相 似 性 分 数 (1s 5.56, ps < 0.001, 
Cohen’s ds > 0.80), 表明 被 试 在 三 个 决策 任务 中 的 扫 视 路 径 模 式 均 存在 差异 。 进 一 步 分 析 发 


M, 为 所 有 人 决策 任务 和 多 次 决策 任务 的 任务 间 相 似 性 分 数 (M = 0.454, 95% CI = [0.439, 


0.469]) 高 于 为 所 有 人 决策 任务 和 单 次 决策 任务 的 任务 间 相 似 性 分 数 (M = 0.432, 95% CI = 


[0.417, 0.446], t47 = 3.46, p = 0.001, Cohen's d = 0.50) 以 及 多 次 决策 任务 和 单 次 决策 任务 的 任 


务 间 相似 性 分 数 (M = 0.434, 95% CI = [0.420, 0.449], t47 = 3.53, p < 0.001, Cohen's d = 0.51), 但 
( E [ > ], 7 p > ) 


是 后 两 个 相似 性 分 数 没有 显著 差异 (ta7 = 0.46, p = 0.645, Cohen’s d 2 0.07)。 该 结果 表明 , 为 


所 有 人 决策 任务 与 多 次 决策 任务 的 扫 视 路 径 模 式 较 于 单 次 决策 任务 更 为 相似 。 


总 的 来 说 , 相似 性 分 数 的 结果 表明 , 虽然 三 个 决策 任务 的 扫 视 路 径 模 式 各 不 相同 , 但 是 为 


所 有 人 决策 任务 和 多 次 决策 任务 的 扫 视 路 径 模式 较 于 单 次 决策 任务 更 为 相似 ,支持 了 Hi。 
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相似 性 分 数 


所 有 人 多 次 单 次 任务 间 - 所 有 人 -多 次 任务 间 - 所 有 人 - 单 次 。 任务 间 - 多 次 - 单 次 


图 3 三 个 任务 的 任务 内 与 任务 间 相 似 性 分 数 。 


误差 棒 表 示 均 值 的 标准 误 。”p < 0.001,“p < 0.01, “p «0.05. 


3.3 眼 动 指标 


为 检验 Ho, 本 研究 考察 了 以 下 眼 动 指标 。(1) 与 前 人 研究 一 致 (Payne & Braunstein, 1978; 


地 


Su et al., 2013), 本 研究 用 信息 搜索 比例 (percentage of total information searched, PTIS) 来 测 


各 任务 的 信息 获取 深度 。(2) 本 研究 用 平均 注视 时 长 (mean fixation duration, MFD) 来 测量 决 


策 过 程 中 信息 加 工 的 复杂 度 。 单 个 注视 点 的 时 长 会 随 着 信息 加 工 复 杂 度 的 升 高 而 增 大 


(Velichkovsky et al., 2002). (3) 本 研究 用 基于 选项 /基于 维度 的 搜索 指数 (search measure 


index, SMD 和 最 好 结果 间 眼 跳 比 例 (proportion of the saccades between the two best outcomes, 


PSTB) 来 衡量 信息 搜索 方向 是 基于 选项 或 基于 维度 的 程度 (B65ckenholt & Hynan, 1994; Pachur 


et al., 2013; Su et al., 2013). SMI RK, 表示 基于 选项 的 眼 跳 模式 越 占 优 (Liu et al., 2021; Su et 


al., 2013)。 如 果 被 试 在 风险 决策 中 采用 期 望 策略 , 那么 相 比 于 采用 启发 式 / 非 期 望 策略 , 其 


PTIS、MFD 和 SMI 值 应 更 高 , PSTB 值 应 更 低 。 


分 别 以 PTIS、MFD、SMI 和 PSTB JARE, 构建 3( 实 验 任务 ) x 3(EV 差异 ) x 3( 结 果 


差异 ) 的 重复 测量 ANOVA, 结果 如 表 2 所 示 。 


结果 发 现 , 实验 任务 在 四 个 眼 动 指标 上 均 存 在 显著 的 主 效应 ( 见 表 2)。 事 后 检验 发 现 : 
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(1) 单 次 决策 任务 中 的 PTIS (M = 92.896, 95% CI = [91.0%, 94.5%]) 显 著 低 于 多 次 决策 任务 CM 


= 95.6%, 95% CI = [93.8%, 97.394], toa = 2.88, p = 0.014) 和 为 所 有 人 决策 任务 (M = 95.3%, 95% 


CI = [93.7%, 97.196], toa = 2.59, p = 0.029) ( 见 图 4a); (2) 单 次 决策 任务 中 的 MDF (M = 224 ms, 


95% CI = [211, 238] ms) 显 著 低 于 多 次 决策 任务 (M = 246 ms, 95% CI = [233, 259] ms, fo4 = 


3.48, p = 0.002) 和 为 所 有 人 决策 任务 (M = 252 ms, 95% CI = [239, 265] ms, toa = 4.45, p < 


0.001) ( 见 图 4b); (3) 单 次 决策 任务 中 的 SMI (M = 0.79, 95% CI = [0.55, 1.03]) 显 著 低 于 多 次 


决策 任务 (M = 1.17, 95% CI = [0.93, 1.40], to4 = 3.14, p = 0.006) 和 为 所 有 人 决策 任务 (M = 1.26, 


95% CI = [1.02, 1.50], to4 = 3.92, p < 0.0 


- 


95% CI = [1.7%, 2.2%]) EE i XU 


= 0.005) 和 为 所 有 人 决策 任务 (M = 1.4%, 95% CI = [1.296, 1.7%], toa = 4.00, p < 0.001) ( 见 图 


01) OLE 4c); (4) 单 次 决策 任务 中 的 PSTB (M = 2.0%, 


REA M = 1.596, 95% CI = [1.396, 1.896], tos = 3.24, p 


4d)。 在 以 上 四 个 指标 上 , 均 未 发 现 多 次 决策 任务 和 为 所 有 人 决策 任务 存在 显著 差异 。 


表 2 以 实验 任务 、EV 差异 、 结 果 差 异 为 自 变量 , 以 PTIS、MFD、SMI 和 PSTB 为 因 变 量 的 方差 分 析 结 果 


OD 

Task x ED 

Task x OD 

ED x OD 

Task x ED x OD 
MFD 

Task 

ED 

OD 

Task x ED 

Task x OD 

ED x OD 

Task x ED x OD 
SMI 

Task 

ED 


df F p T 
2, 94 5.02 0.008 0.10 
2, 94 0.19 0.827 0.00 
2, 94 3.68 0.029 0.07 
4, 188 1.03 0.396 0.02 
4, 188 2.96 0.021 0.06 
4, 188 0.57 0.686 0.01 
8, 376 0.93 0.488 0.02 
2,94 10.94 « 0.001 0.19 
2, 94 22.15 « 0.001 0.33 
2, 94 2.93 0.058 0.06 
4, 188 5.78 « 0.001 0.11 
4, 188 1.22 0.304 0.03 
4, 188 3.65 0.007 0.07 
8, 376 1.79 0.079 0.04 
2, 94 8.59 < 0.001 0.16 
2, 94 0.72 0.487 0.02 


OD 2, 94 0.32 0.725 0.01 
Task x ED 4, 188 1.60 0.177 0.03 
Task x OD 4, 188 0.16 0.961 0.00 
ED x OD 4, 188 6.84 « 0.001 0.13 
Task x ED x OD 8, 376 1.20 0.298 0.03 
PSTB 
Task 2, 94 9.03 « 0.001 0.16 
ED 2, 94 1.49 0.230 0.03 
OD 2, 94 5.14 0.008 0.10 
Task x ED 4, 188 0.96 0.433 0.02 
Task x OD 4, 188 0.86 0.491 0.02 
ED x OD 4, 188 0.33 0.860 0.01 
Task x ED x OD 8, 376 1.30 0.244 0.03 


VE: Task 表示 实验 任务 , ED (EV difference) 表 示 EV 差异 , OD (outcome difference) Kj Zi REF» 


ANOVA 结果 发 现 , 实验 任务 与 结果 差异 在 PTIS 这 一 变量 上 存在 显著 交互 作用 ( 见 


1)。 简 单 效 应 分 析 发 现 , 在 单 次 决策 任务 中 , 大 结果 差异 条 件 下 的 PTIS 显著 低 于 小 结果 差异 


条 件 (1277 = 4.04, p = 0.002)。 为 所 有 人 决策 任务 和 多 次 决策 任务 在 PTIS 指标 上 无 显著 差 


异 。 本 研究 在 PTIS 指标 上 关于 结果 差异 只 影响 单 次 决策 任务 的 发 现 支 持 了 Ha。 


ANOVA 结果 还 发 现 , 实验 任务 与 EV 差异 在 MED 指标 上 存在 显著 交互 作用 ( 见 表 1)。 


简单 效应 分 析 发 现 , 在 为 所 有 人 决策 任务 中 , 大 EV 差异 条 件 下 的 MED 显著 低 于 中 EV 差异 


= ZENE lsi = 7.65, p < 0.001) 和 小 EV 差异 条 件 (12819 = 3.28, p = 0.031)!。 多 次 决策 任务 和 单 次 


决策 任务 在 MED 指标 上 无 显著 差异 。 本 研究 在 MED 指标 上 关于 EV 差异 只 影响 为 所 有 人 


决策 任务 的 发 现在 一 定 程度 上 支持 了 Ha。 


! 与 预期 不 符 的 是 , 中 EV 差异 条 件 的 MFD 显著 大 于 小 EV 差异 条 件 。 这 一 结果 可 能 是 由 于 小 EV 差异 条 件 
的 计算 难度 低 于 中 EV 差异 条 件 。 我 们 猜测 , 概率 为 10%( 或 金钱 结果 为 100 元 ) 的 选项 计算 期 望 价值 的 难度 
低 于 其 他 概率 (或 金钱 结果 ) 的 选项 。 事 后 观察 发 现 , 小 EV 差异 条 件 比 中 EV 差异 条 件 包 含 更 多 低 计算 难度 
的 选项 (小 EV 差异 条 件 有 26 个 选项 是 低 计 算 难 度 , 中 EV 差异 条 件 有 18 个 选项 是 低 计算 难度 )。 分 析 发 现 ， 
在 控制 计算 难度 后 , 在 为 所 有 人 决策 任务 中 小 、 中 EV 差异 条 件 的 MDF 没有 显著 差异 (F(1, 47) = 1.79, p = 
0.187, n% = 0.04), 这 在 一 定 程度 上 支持 了 我 们 的 猜测 。 
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口 小 EV 差异 图 中 EV 差异 日 大 EV 差异 


图 4 眼 动 指标 结果 。(a) PTIS 指标 结果 。(b) MFD 指标 结果 。(c) SMI 指标 结果 。(d) PSTB 指标 结果 。 


误差 棒 表 示 均 值 的 标准 误 。**p < 0.001,""p < 0.01, “p < 0.05. 


以 上 结果 暗示, 相 比 于 多 次 决策 任务 和 为 所 有 人 决策 任务 , 被 试 在 单 次 决策 任务 中 的 信 


县 获取 深度 更 低 , 信息 加 工 复 杂 度 更 低 , 更 可 能 采用 基于 维度 的 信息 搜索 模式 。 这 些 结果 表 


明 , 个 体 在 单 次 决策 任务 中 进行 风险 决策 时 更 可 能 采用 了 局 发 式 / 非 期 望 策略 进行 决策 , 而 在 


为 所 有 人 决策 任务 和 多 次 决策 任务 中 更 符合 期 望 策略 的 加 权 求 和 加 工 过 程 。 


3.4 中 介 分 析 


为 检验 Hs, 本 研究 检验 了 眼 动 指标 是 否 中 介 了 决策 任务 对 个 体 的 选择 是 否 符合 EV 预 


测 的 效应 。 设 定 因 变量 为 选择 是 否 符合 EV 预测 (选择 EV 较 大 选项 记 为 1, 否则 记 为 0)。 本 


研究 采用 SPSS 的 MEMORE (Montoya & Hayes, 2017) 软 件 包 中 的 平行 多 中 介 变 量 模型 来 检 


验 决策 任务 通过 一 系列 平行 中 介 变 量 进而 影响 个 体 的 选择 是 否 符合 EV 预测 的 效应 。 这 一 


模型 可 允许 中 介 变 量 之 间 存 在 相关 性 , 且 能 够 佑 计 控 制 其 他 中 介 变 量 的 效应 之 后 的 各 中 介 变 


量 的 间接 效应 。 由 于 MEMORE 软件 包 只 允许 放 入 2 水 平 的 组 内 条 件 , 因此 本 研究 构建 了 2 


个 中 介 分 析 , 即 分 别 检验 两 类 决策 任务 ( 单 次 决策 任务 vs. 为 所 有 人 决策 任务 / 单 次 决策 任务 
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vs. 多 次 决策 任务 ) 通 过 上 文 提 到 的 眼 动 指标 对 个 体 的 选择 是 否 符 合 EV 预测 的 影响 。 基 于 


5000 次 bootstrap 抽样 生成 95% 置 信 区 间 ( 在 下 文中 括号 中 报告 )。 


单 次 决策 任务 vs. 为 所 有 人 决策 任务 。 中 介 分 析 结 果 如 图 5a 所 示 。 决 策 任务 通过 以 下 


四 个 眼 动 指标 对 个 体 的 选择 是 否 符合 EV 预测 的 间接 效应 显著 : PTIS (aibi = 0.008 [0.005, 


0.012]), MED (aab; = 0.021 [0.013, 0.028]), SMI (a3b3 = 0.014 [0.009, 0.018]), 以 及 PSTB (aba 


= 0.006 [0.004, 0.008]))。 决 策 任务 对 因 变 量 的 总 效应 显著 (c = 0.31 [0.29, 0.32], p < 0.001), 直 


接 效 应 也 显著 (c" = 0.26 [0.24, 0.28], p < 0.001), 说 明 在 控制 以 上 中 介 变 量 后 , 决策 任务 仍然 能 


够 解释 因 变 量 的 变异 ( 见 图 5a)。 对 各 间接 效应 进行 配对 检验 发 现 , MFD 对 因 变 量 的 贡献 显 


著 高 于 PTIS (a2b; — aibi = 0.013 [0.004, 0.020) 和 PSTB (a2b2 — a4b4= 0.015 [0.007, 0.023]), 


SMI 对 因 变 量 的 贡献 显著 高 于 PSTB (a3b3 — a4b4 = 0.008 [0.002, 0.013]). MFD 5 SMI 的 贡 


献 无 显著 差异 (a3b3 — aab; = -0.007 [-0.016, 0.002])。 


单 次 决策 任务 vs. 多 次 决策 任务 。 中 介 分 析 结 果 如 图 5b 所 示 。 决 策 任务 通过 以 下 四 个 


眼 动 指标 对 个 体 的 选择 是 否 符合 EV 预测 的 间接 效应 显著 : PTIS (aib = 0.010 [0.006, 0.014])， 
MED (aob» = 0.030 [0.023, 0.036]), SMI (a3b3 = 0.012 [0.008, 0.016]), 以 及 PSTB (aaba = 0.003 


[0.001, 0.005])。 决 策 任 务 对 因 变 量 的 总 效应 显著 (c = 0.22 [0.21, 0.24], p < 0.001), 直接 效应 


也 显著 (c" = 0.17 [0.15, 0.19], p < 0.001), 说 明 在 控制 以 上 中 介 变 量 后 , 决策 任务 仍然 能 够 解释 


因 变 量 的 变异 ( 见 图 5b)。 对 各 间接 效应 进行 配对 检验 发 现 , MFD 对 因 变 量 的 贡献 显著 高 于 


其 他 三 个 指标 (qa2b2 — aibi 0.020 [0.012, 0.028], a2b2 — a3b3= 0.018 [0.010, 0.026], a2b2 — aaba 


= 0.027 [0.020, 0.034]), PTIS 和 SMI 对 因 变 量 的 贡献 显著 高 于 PSTB (aibi — a4b4= 0.007 


[0.002, 0.011], a3b3 — aab4 = 0.009 [0.004, 0.014])。 
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单 次 决策 任务 vs. 为 所 有 DU 0.31°(0.26"") 
人 决策 任务 


单 次 决策 任务 vs. 多 次 决 0.22""(0.17"") 
策 任务 


图 5 中 介 分 析 结 果 。(a) 决策 任务 ( 单 次 决策 任务 vs. 为 所 有 人 决策 任务 ) 通 过 眼 动 指标 对 个 体 的 选择 是 
fr EV 预测 的 中 介 效 应 。(b) 决策 任务 ( 单 次 决策 任务 vs. 多 次 决策 任务 ) 通 过 眼 动 指标 对 个 体 的 选择 是 
E EV 预测 的 中 介 效 应 。”p < 0.001 。 


mom 


AS 
H 
a 


与 研究 假设 一 致 ,中介 分 析 结 果 发 现 眼 动 指标 能 够 中 介 决 策 任务 对 个 体 的 选择 是 否 符合 


EV 预测 的 效应 。 在 4 个 眼 动 指标 中 , MFED( 反 映 信息 加 工 复杂 度 的 指标 ) 和 SMI( 反 映 信息 搜 


上 


索 方向 的 指标 ) 的 中 介 效 应 最 强 。 相 比 于 单 次 决策 任务 , 在 多 次 决策 任务 和 为 所 有 人 决策 任 


FF, 被 试 的 信息 搜索 深度 和 信息 加 工 复杂 度 更 高 、 更 多 采用 基于 选项 的 信息 搜索 模式 , 从 


而 导致 其 更 可 能 选择 EV 值 较 大 的 选项 。 


4 讨论 


关于 风险 决策 是 基于 期 望 策略 还 是 启发 式 / 非 期 望 策略 的 争论 至 今 尚 未 完美 解决 (Pachur 


et al., 2013)。 本 研究 基于 过 程 检 验 的 视角 , 采用 了 眼 动 追踪 技术 探索 了 基于 期 望 值 最 大 化 的 理 


论 与 启发 式 / 非 基 于 期 望 值 最 大 化 的 理论 的 边界 。 
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本 研究 的 行为 和 眼 动 分 析 结 果 总 结 见 图 6。 行为 结果 揭示 , 相 比 于 单 次 决策 任务 , 在 为 


所 有 人 决策 任务 和 多 次 决策 任务 中 , 被 试 的 选择 符合 EV 和 EU 理论 预测 的 比例 更 大 , 且 需 


要 更 长 时 间 进 行 决 策 。 此 外 , 眼 动 指标 结果 揭示 : (1) 为 所 有 人 决策 任务 和 多 次 决策 任务 的 扫 


视 路 径 模式 更 相似 , 有 旦 显著 不 同 于 单 次 决策 任务 ; (2) 为 所 有 人 决策 任务 和 多 次 决策 任务 的 信 


息 获取 深度 高 于 单 次 决策 任务 , 且 结 果 差 异 大 小 只 影响 单 次 决策 任务 中 的 信息 获取 深度 ; (3) 


为 所 有 人 决策 任务 和 多 次 决策 任务 的 信息 加 工 复杂 度 高 于 单 次 决策 任务 , HEV 差异 大 小 只 


影响 为 所 有 人 决策 任务 的 信息 加 工 复 杂 度 ; (4) 相 比 于 单 次 决策 任务 , 被 试 在 为 所 有 人 决策 任 


务 和 多 次 决策 任务 中 更 多 采用 基于 选项 的 信息 搜索 方向 ; (5) 眼 动 指标 中 介 了 决策 任务 对 选 


择 是 否 符合 EV 预测 的 效应 。 总 之 , 行为 和 眼 动 指标 结果 均 表 明 , 相 比 于 单 次 决策 任务 , 被 试 


在 为 所 有 人 决策 任务 和 多 次 决策 任务 中 更 可 能 采用 期 望 策略 。 


行为 结果 
选择 符合 EV 预测 比例 决策 时 间 29] 
r1 8096 r1 5 
58% ñ 89% 8.75 T 
8.91 
信息 获取 深度 信息 加 工 复杂 度 
EHS 95.3196 MFD 
Q o 
Uu 5 246.1 ms 
————Ó ee 
92.79% 1 224.3 ms t 252.1 ms 
95.59% 
信息 搜索 方向 
SMI PSTB 
g 1.17 g . 1.51% g 
NE RÀ 


箭头 表示 期 望 理论 预测 的 方向 


单 次 决策 任务 多 次 决策 任务 为 所 有 人 决策 任务 


E EV 差异 的 效应 显著 结果 差异 的 效应 显著 


6 行为 和 眼 动 指标 结果 总 结 。 


Ds 
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TE: 相 比 于 启发 式 理论 , 基于 期 望 值 最 大 化 的 理论 预测 个 体 的 选择 符合 EV 预测 比例 更 大 , 反应 时 更 长 , 信息 
获取 深度 更 高 , 信息 加 工 复杂 度 更 高 , 更 多 采用 基于 选项 的 信息 搜索 方向 。 


H 


到 前 文 提 到 的 关于 “为 什么 主流 理论 家 不 放弃 基于 期 望 值 最 大 化 的 理论 ”这 一 问题 。 


我 们 以 为 , 或 许 是 因为 有 两 个 信念 文 撑 着 这 些 理论 家 对 基于 期 望 值 最 大 化 的 理论 不 离 不 弃 : 


一 是 为 发 展 出 用 于 描述 所 有 人 的 决策 理论 而 诞生 的 基于 期 望 值 最 大 化 的 理论 确实 能 够 描 


为 所 有 人 决策 的 情境 ; 二 是 理论 家 默认 单一 个 体 是 包含 在 所 有 人 中 的 子 集 。 由 此 推论 , 基于 


期 望 值 最 大 化 的 理论 最 终 当 可 捕获 每 个 个 体 的 风险 决策 行为 。 


针对 第 一 个 信念 , 本 研究 从 过 程 检 验 的 视角 为 期 望 法 则 的 优美 公式 符合 个 体 为 所 有 人 做 


风险 决策 提供 了 眼 动 的 支持 证 据 。 考 虑 到 在 大 数 定律 中 , “多 次 ”和 “多 人 ”的 意义 相通 , 本 研 


究 的 这 一 观点 同样 被 多 次 决策 任务 中 的 发 现 所 支持 。 而 以 往 众 多 或 结果 导向 或 过 程 导向 的 


研究 ,有 专注 于 验证 基于 期 望 值 最 大 化 的 理论 可 否 描 述 “ 为 自己 ”的 实际 风险 决策 


(Brandstitter & Körner, 2014; Li, 2004; Pachur et al., 2013; Rao et al., 2013; Sun et al., 2013), 有 


专注 于 验证 基于 期 望 值 最 大 化 的 理论 可 否 描述 “为 他 人 ”的 实际 风险 决策 (Beisswanger et al., 


nr 


2003; Hsee & Weber, 1997; Mengarelli et al., 2014; Polman, 2012), 但 尚 没有 研究 收集 “为 所 有 


人 ”决策 的 证 据 , 以 验证 基于 期 望 值 最 大 化 的 理论 可 和 否 描述 “为 所 有 人 ”的 实际 风险 决策 。 本 


研究 发 现 , 个 体 在 “为 所 有 人 ”做 决策 时 , 还 真 像 Raiffa 教授 故事 中 的 系 主任 所 建议 的 那样 , 会 


进行 加 权 求 和 并 计算 总 分 的 算计 。 


针对 第 二 个 信念 , 主流 理论 家 会 想当然 地 认为 : 为 描述 所 有 人 (全 集 ) 的 决策 行为 发 展 而 


来 的 基于 期 望 值 最 大 化 的 理论 也 就 一 定 能 够 描述 包含 于 所 有 人 中 的 单个 人 ( 子 集 ) 的 决策 行 


为 。 然 而 , 本 研究 的 行为 和 了 眼 动 指标 结果 首次 向 世人 展现 : 为 自己 决策 与 为 所 有 人 决策 是 不 


同 的 。 为 自己 决策 是 一 回 事 , 为 所 有 人 决策 是 另外 一 回 事 。 因 此 , 理论 家 为 所 有 人 发 展 出 的 


基于 期 望 值 最 大 化 的 理论 不 见得 适用 于 描述 单一 个 体 做 决策 的 情况 。 本 研究 这 首次 公布 于 


众 的 “所 有 人 -单个 人 ”的 差异 内 隐 地 提示 , 基于 期 望 值 最 大 化 的 理论 在 为 自己 决策 时 行 不 通 


的 原因 可 能 是 , 全 集 ( 所 有 人 ) 和 子 集 ( 单 个 人 ) 之 间 的 默认 兼容 性 或 是 不 存在 的 。 


部 
B 
i 
SI 


不 可 能 出 现 裂 痕 的 环节 上 出 现 了 不 易 察觉 的 裂缝, 才 使 得 基于 期 望 值 最 大 化 的 理论 “莫名 其 


妙 ” 地 失效 了 。 


当 重 新 审视 帕斯卡 和 费 马 提出 来 的 期 望 价值 理论 , 本 研究 发 现 有 两 点 值得 读者 深 ) 


o AG 


I 
Cn 


一 , 他 们 发 展 EV 理论 的 初衷 , 是 为 赌 徒 (而 非 为 自己 ) 的 赌 金 分 配 问题 提供 一 个 最 优 方案 , 该 


方案 对 任何 一 个 面临 该 问题 的 人 都 适用 (Durrett 2010; Vinod & Reagle, 2005)。 与 帕斯卡 和 


费 马 的 本 意 相符 , 本 研究 的 行为 和 眼 动 结果 揭示 , 在 多 人 、 多 次 决策 条 件 下 比 在 为 自己 决策 


条 件 下 更 符合 EV 策略 , 表明 帕斯卡 和 费 马 的 EV 理论 确实 能 够 捕获 为 所 有 人 的 风险 决策 。 


第 二 , 本 研究 发 现 , 在 为 所 有 人 决策 的 时 候 , EV 理论 已 能 足够 准确 地 预测 人 们 的 风险 决策 (在 


为 所 有 人 决策 任务 中 , EV 理论 的 预测 准确 率 高 达 89%), 但 是 在 单 次 决策 任务 中 , 尚 不 能 够 准 


确 地 预测 人 们 的 风险 决策 (在 单 次 决策 任务 中 , EV 理论 的 预测 准确 率 仅 为 5870), 这 表明 在 描 


述 个 体 为 所 有 人 做 出 的 决策 时 , 简单 的 EV 理论 似乎 已 经 足 矣 。 值 得 指出 的 是 , 虽然 在 单 次 


决策 任务 中 , CPT 的 预测 准确 率 (M= 72%) 显 著 高 于 其 他 模型 , 但 是 这 一 预测 力 是 采用 极 大 化 


O 正确 率 的 方法 进行 参数 估计 得 出 的 , 使 得 该 模型 在 预测 正确 率 上 相 较 于 其 他 模型 具有 较 大 优 


势 , 同时 牺牲 了 模型 的 简约 性 。 此 外 , 也 有 研究 者 质疑 CPT 是 否 属于 期 望 值 最 大 化 的 理论 ， 


例如 有 研究 者 发 现 CPT 也 可 很 好 地 适 配 由 启发 式 模型 所 生成 的 决策 数据 模式 (Pachur et al., 


2017)。 


本 研究 对 风险 决策 理论 的 划分 提出 了 新 的 见解 。 从 EV 理论 诞生 之 日 起 , 期 望 家 族 理 论 


直 因 为 其 无 法 描述 个 体 的 实际 风险 决策 ( 即 , 屡屡 应 付 不 了 不 能 解释 的 悖 论 , AU ETE TR 


论 、 艾 勒 悖 论 以 及 其 他 新 的 风险 决策 悖 论 (Bimbaum, 2008)) 而 被 迫 不 断 修改 。 传 统 的 EV 理 


论 被 修正 为 EU 理论 (von Neumann & Morgenstern, 1947), SEU 理论 (Savage, 1954), 加 权 效 用 
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模型 (Edwards, 1962), 等 级 相关 效用 模型 (Quiggin, 1982), 等 级 和 符号 相关 效用 模型 (Luce & 


Fishburn, 1991), 以 及 第 三 代 预 期 理论 (Schmidt et al., 2008), 等 等 。 这 种 不 断 修 正 的 灵魂 可 反 


WEF Tversky 在 一 封 审 稿 信 中 的 评论 : “决策 过 程 中 任何 明确 的 选择 法 则 都 可 以 描述 成 某 个 


函数 的 最 大 化 。 因 此 , 问题 不 在 于 选择 过 程 是 否 被 描述 成 一 个 最 大 化 的 过 程 , 而 是 完 竟 哪 个 


函数 被 最 大 化 了 ”(Tversky IRIA JL Li, 2016, pp. 68-69)。 但 是 , 这 种 从 未 停止 的 修正 反而 上 暗示， 


至 今 还 没有 一 个 基于 期 望 值 最 大 化 的 理论 能 够 完美 描述 个 体 的 实际 风险 决策 行为 。 由 于 基 


于 期 望 值 最 大 化 的 理论 表现 不 佳 , 目前 理论 界 已 经 无 奈 地 把 决策 理论 分 为 规范 性 理论 


(normative theories) 和 描述 性 理论 (descriptive theories) (Baron, 2008) 两 类 。 换 句 话 说, 理论 家 


不 得 不 给 基于 期 望 值 最 大 化 的 理论 一 个 规范 性 理论 的 名 分 却 包容 它 无 法 描述 个 体 真实 的 风 


险 决 策 行为 。 与 规范 性 理论 的 普遍 认可 的 概念 有 出 入 , 本 研究 发 现 提示 , 作为 最 简单 、 最 原 


始 的 规范 性 理论 , EV 理论 反而 不 经 修正 其 客观 概率 和 客观 结果 就 能 够 完美 地 描述 个 体 为 所 


有 人 决策 时 的 实际 风险 决策 行为 。 


或 许 , 如 果 要 求 一 个 理论 能 够 描述 个 体 为 自己 决策 时 的 实际 风险 决策 行为 , 当下 和 迫切 要 


做 的 不 是 继续 修正 基于 期 望 值 最 大 化 的 理论 , 而 是 从 非 补偿 性 的 、 非 期 望 值 最 大 化 的 角度 来 


发 展 、 完 善 启 发 式 / 非 期 望 的 决策 理论 。 


本 文通 过 眼 动 实验 , 考察 了 个 体 在 为 所 有 人 决策 任务 、 多 次 决策 任务 和 单 次 决策 任务 中 


的 行为 和 眼 动 指标 , 得 到 如 下 结论 : (1) 相 比 于 单 次 决策 任务 , 个 体 在 多 次 决策 任务 和 为 所 有 


人 决策 任务 中 更 可 能 采用 EV 策略 , 其 决策 时 间 更 长 。(2) 就 扫 视 轨迹 模式 而 言 , AT AR 


策 任 务 和 多 次 决策 任务 的 相似 性 , 高 于 为 所 有 人 决策 任务 和 单 次 决策 任务 的 相似 性 。(3) 眼 


动 指标 可 中 介 决 策 任务 对 个 体 选择 是 否 符 合 EV 预测 的 效应 。(4) 结果 差异 影响 单 次 决策 任 
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务 的 信息 加 工 过 程 , EV 差异 影响 为 所 有 人 决策 任务 的 信息 加 工 过 程 。 总 体 结 果 表明 , 基于 期 


望 值 最 大 化 的 理论 可 捕获 为 所 有 人 决策 时 的 行为 , 但 不 能 捕获 为 自己 决策 时 的 行为 。 这 些 发 


现 揭 示 了 基于 期 望 值 最 大 化 的 理论 与 启发 式 / 非 基于 期 望 值 最 大 化 的 理论 的 边界 , 为 风险 决 


策 理论 的 划分 和 发 展 提供 实证 参考 。 
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Abstract 


Mainstream theorists in risky decision-making have developed various expectation- 
maximization-based theories with the ambitious goal of capturing everyone's choices. However, 
ample evidence has revealed that these theories could not capture every individual's (“every 
one's") actual risky choice as descriptive theories. Substantial research has demonstrated that 
people do not follow the logical process suggested by expectation-maximization-based theories 
when making risky choices but rather rely on simplifying heuristics. From our perspective, the 
possible reason why mainstream decision theorists did not abandon the framework of expectation 
is that these theorists never doubted the validity of the expectation rule as a descriptive rule in 
describing decision-making under risk. We believe that expectation-maximization-based theories 
may capture risky choices when individuals make decisions for everyone. However, whether these 
theories could capture risky choices when individuals make decisions for themselves cannot be 
taken for granted. We thus used an eye-tracking technique to explore whether a theory for 
everyone would work well for every one. 

A total of 52 college students participated in the experiment. Three risky choice tasks were 
conducted in the present study: a D-everyone task, a D-multiple task, and a D-single task. In the 
D-everyone task, participants were asked to choose the more optimal option out of two options 
under the assumption that their selection would be the final decision for everyone who was facing 
the same choice—that is, everyone would be subject to the same choice but could receive different 
outcomes. In the D-multiple task, participants were asked to choose between the two options 
under the assumption that their selection would be applied a total of 100 times. In the D-single 
task, participants were asked to choose between the two options under the assumption that their 
selection would be applied only once to themselves. The participants’ eye movements were 
recorded while they performed the tasks. 

Behavioral results revealed that, compared with the D-single task, participants selected more 
choices correctly predicted by EV and EU theories, and took a longer time to make a decision in 
the D-everyone and D-multiple tasks. Furthermore, eye movement measurements revealed the 
following. (1) The scanpath patterns of the D-everyone task and D-multiple task were similar but 
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different from those of the D-single task. (2) The depth of information acquisition and the level of 
complexity of information processing in the D-everyone task and D-multiple task was higher than 
that in the D-single task. (3) The direction of information search in the D-everyone task and D- 
multiple task was more alternative-based than that in the D-single task. (4) The eye-tracking 
measures mediated the relationship between the task and the EV-consistent choice. In summary, 
behavioral and eye movement results supported our hypotheses that participants were likely to 
follow an expectation strategy in the D-everyone and D-multiple tasks, whereas they were likely 
to follow a heuristic/non-expectation strategy in the D-single task. 

We found that expectation-maximization-based theories could capture the choice of an 
individual when making decisions for everyone and for self in a multiple-play condition but could 
not capture the choice of an individual when making decisions for self in a single-play condition. 
The evidence for the discrepancy between everyone and every one, which was first reported in our 
study, implied that the possible reason why expectation-maximization-based theories do not work 
is that a default compatibility between the full set (everyone) and the subset (every one) does not 
exist. Our findings contribute to an improved understanding of the boundaries of expectation- 
maximization-based theories and those of heuristic/non-expectation models. Our findings may 


also shed light on the general issue of the classification of risky decision-making theories. 


Keywords risky choice, decision for everyone, expectation-maximization, discrepancy 


between everyone and every one, eye-tracking 
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